ارائه یک روش نمایه سازی معنایی بر پایه هستی شناسی برای نمایه سازی متون و اسناد علمی

thesis
abstract

با رشد فزاینده و لجام گسیخته اطلاعات دیجیتالی و نیاز به دستیابی به اطلاعات مورد نظر از میان خیل انبوه متون و اسناد موجود در زمان معقول، نیاز به سیستم های بازیابی اطلاعاتی که بتوانند نیاز اطلاعاتی کاربران را کامل تر و دقیق تر تشخیص داده و متون و اسناد مرتبط با آن را بازیابی کند، بیش از پیش احساس می شود. به دلیل ویژگی های خاص زبان طبیعی نظیر چند معنایی عبارت، ارتباطات معنایی نهفته و ... ، تنها مقایسه عبارات موجود در پرس جوی کاربران با اسناد موجود به منظور جستجوی نیاز اطلاعاتی کاربران در نمایه سیستم، کافی نبوده و نتایج حاصل نمی تواند به طور مطلوب پاسخ گوی نیاز کاربران باشد. هدف از انجام این تحقیق شناسایی مفاهیم مستتر در دامنه معنایی متون و اسناد، به منظور استفاده در نمایه سازی و بهبود عملکرد سیستم های بازیابی اطلاعات می باشد. برای انجام این کار دامنه معنایی متن را با استفاده از دامنه معنایی مفاهیم که در پایگاه دانش سیستم تعریف شده، شناسایی می نماییم. سپس مفاهیم مستتر در دامنه معنایی متن را استخراج و بر اساس ارتباط معنایی که با متن(مفاهیم موجود در متن) دارند، رده بندی می کنیم. مفاهیم موجود در صدر رده بندی فوق به عنوان مهم ترین مفاهیم مستتر در دامنه معنایی متن به نمایه متن افزوده می شوند تا در زمان مقایسه پرس جوها با نمایه مدنظر قرار بگیرند. پیاده سازی ایده فوق به ابداع دو روش اکتشافی، یکی در زمینه مهندسی دانش و هستی شناسی و دیگری در زمینه پردازش زبان طبیعی انجامید. در زمینه هستی شناسی یک روش جدید برای نمایش مفاهیم توسط یک بردار معنایی در فضای n-بعدی دامنه ارائه شد. برای نگاشت متن به پایگاه دانش سیستم، مفهوم هسته های معنایی متن بر اساس زنجیره های معنایی ارائه شده و مورد استفاده قرار گرفت. برای ارزیابی ایده های موردنظر، سیستم فوق به صورت یک ماجول پیش پردازش گر به یک سیستم بازیابی اطلاعات فضای برداری وزن دار(vsm) افزوده شده و تغییرات عملکرد این سیستم در حالت عادی (بدون وجود ماجول پیش پردازش گر) و هنگامی که ورودی آن از سیستم مورد نظر ما تامین می شود، مقایسه شد. در پیاده سازی ماجول پیش پردازش گر معنایی از wordnet به عنوان پایگاه دانش سیستم استفاده شد. نتایج ارزیابی عملکرد سیستم بر روی 4 مجموعه از اسناد آزمایش سیستم های بازیابی اطلاعات، حاکی از عملکرد نوید بخش در صورت تعیین مقادیر مناسب برای پارامترهای ورودی و استفاده از پایگاه دانش مناسب می باشد.

First 15 pages

Signup for downloading 15 first pages

Already have an account?login

similar resources

اهمیت رعایت اصول نمایه سازی در مستندات علمی

نمایه‌سازی اطلاعات در ابعاد مختلف به ویژه نمایه‌سازی مستندات علمی امروزه ضرورتی اجتناب‌ناپذیر است. زیرا دستیابی سریع به اطلاعات علمی مورد نظر از میان حجم عظیم تولیدات علمی جهان تنها از طریق نمایه‌سازی و بهره‌گیری از فناوری اطلاعات مقدور می‌باشد. در نمایه کردن مستندات علمی، نویسندگان مستندات علمی اولین کسانی هستند که باید اصول نگارش و همگرایی را در انتخاب واژه‌های کلیدی، اساسی، عناوین و آدرس‌ها ...

full text

بررسی وضعیت نمایه سازی اسناد آرشیوی مکتوب در مراکز آرشیوی شهر تهران از دیدگاه نمایه سازان با تأکید بر شیوه و کیفیت نمایه سازی اسناد آرشیوی

هدف: پژوهش حاضر، با هدف آگاهی از وضعیت نمایه سازی اسناد آرشیوی مکتوب در مراکز آرشیوی شهر تهران انجام شده است. روش/ رویکرد پژوهش: روش پژوهش، پیمایشی توصیفی و ابزار گردآوری داده ها پرسشنامه است. جامعۀ پژوهش شامل 100 نفر از نمایه سازان مراکز آرشیوی تهران است که کلیۀ آن ها به پرسشنامه ها پاسخ داده اند. یافته ها: یافته های پژوهش نشان داد که 42 درصد نمایه سازان، برای نمایه سازی، از هر دو زبان کنترل ش...

full text

مدل دو مرحله ای شکاف- گلچین برای نمایه سازی خودکار متون فارسی

Purpose: Each language has its own problems. This leads to consider appropriate models for automatic indexing of every language. These models should concern the exhaustificity and specificity of indexing.   This paper aims at introduction and evaluation of a model which is suited for Persian automatic indexing. This model suggests to break the text into the particles of candidate terms and to c...

full text

اصطلاحنامه ابزاری مهم برای نمایه سازی منابع آرشیوی

مقاله حاضر، با شرح مختصری درباره زبان نمایه سازی به منزله یکی از عواملی که بر کارائی نمایه سازی تاثیر می گذارد شروع شده، موضوع با مروری بر زبان های نمایه سازی پی گرفته می شود. اصطلاحنامه به لحاظ ساختاری و کارکردی تعریف شده، شرح داده می شود. در ادامه، تاریخچه اصطلاحنامه در ایران و خارج از کشور آورده می شود. شکل اصطلاحنامه (نحوه نمایش اصطلاحات و روابط معنائی آن ها) بیان شده، قواعد تدوین اصطلاحنام...

full text

My Resources

Save resource for easier access later

Save to my library Already added to my library

{@ msg_add @}


document type: thesis

وزارت علوم، تحقیقات و فناوری - دانشگاه اصفهان

Hosted on Doprax cloud platform doprax.com

copyright © 2015-2023